检索结果

Select

1. 基于分块注意力机制和交互位置关系的群组活动识别

刘博, 卿粼波, 王正勇, 刘美, 姜雪

《计算机应用》唯一官方网站 2022, 42 (7): 2052-2057. DOI: 10.11772/j.issn.1001-9081.2021060904

摘要（274）

HTML （15）

PDF （2504KB）（104）

复杂场景下的群体活动识别是一项具有挑战性的任务，它涉及一组人在场景中的相互作用和相对空间位置关系。针对当前复杂场景下群组行为识别方法缺乏精细化设计以及没有充分利用个体间交互式特征的问题，提出了基于分块注意力机制和交互位置关系的网络框架，进一步考虑个体肢体语义特征，同时挖掘个体间交互特征相似性与行为一致性的关系。首先，采用原始视频序列和光流图像序列作为网络的输入，并引入一种分块注意力模块来细化个体的肢体运动特征；然后，将空间位置和交互式距离作为个体的交互特征；最后，将个体运动特征和空间位置关系特征融合为群体场景无向图的节点特征，并利用图卷积网络（GCN）进一步捕获全局场景下的活动交互，从而识别群体活动。实验结果表明，此框架在两个群组行为识别数据集（CAD和CAE）上分别取得了92.8%和97.7%的识别准确率，在CAD数据集上与成员关系图（ARG）和置信度能量循环网络（CERN）相比识别准确率分别提高了1.8个百分点和5.6个百分点，同时结合消融实验结果验证了所提算法有较高的识别精度。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

2. 基于改进VGG网络的弱监督细粒度阿尔兹海默症分类方法

邓爽, 何小海, 卿粼波, 陈洪刚, 滕奇志

《计算机应用》唯一官方网站 2022, 42 (1): 302-309. DOI: 10.11772/j.issn.1001-9081.2021020258

摘要（483）

HTML （14）

PDF （868KB）（222）

针对阿尔兹海默症（AD）患者和正常（NC）人之间核磁共振成像（MRI）图像差别小、分类难度大的问题，提出了基于改进VGG网络的弱监督细粒度AD分类方法。该方法以弱监督数据增强网络（WSDAN）为基本模型，主要由弱监督注意力学习模块、数据增强模块及双线性注意力池化模块等构成。首先，通过弱监督力注意学习模块生成特征图和注意力图，并利用注意力图引导数据增强，将原图和增强后的数据同时作为输入数据进行训练；然后，通过双线性注意力池化算法将特征图和注意力图按元素进行点乘，进而得到特征矩阵；最后，将特征矩阵作为线性分类层的输入。将以VGG19作为特征提取网络的WSDAN基本模型应用到AD的MRI数据上，实验结果表明，仅使用图像增强的模型的准确性、敏感性和特异性分别比WSDAN基本模型提高了1.6个百分点、0.34个百分点和0.12个百分点；仅利用VGG19网络的改进的模型的准确性和特异性相较WSDAN基本模型分别提高了0.7个百分点和2.82个百分点；以上两个方法结合使用的模型与WSDAN基本模型相比，准确性、敏感性和特异性分别提高了2.1个百分点、1.91个百分点和2.19个百分点。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

3. 结合图像增强和卷积神经网络的小麦不完善粒识别

贺杰安, 吴晓红, 何小海, 胡建蓉, 卿粼波

计算机应用 2021, 41 (3): 911-916. DOI: 10.11772/j.issn.1001-9081.2020060864

摘要（382）

PDF （1123KB）（695）

针对实际应用场景下，小麦籽粒图像背景单一以及小麦不完善粒的不完善特征大多是局部特征而大部分图像特征与正常粒无异的特点，提出一种基于细节的图像增强（IE）的小麦不完善粒识别方法。首先，使用交替最小化算法约束原图在水平方向和竖直方向的L0范数来平滑原图作为基础图层，并用原图减去基础图层得到图像的细节层；然后，突出细节层后将其与基础图层叠加以增强图像；最后，将增强后的图像作为卷积神经网络（CNN）的输入，使用加入了批正则化（BN）层的CNN对图像进行识别。分别以经典分类网络LeNet-5、ResNet-34、VGG-16和在其中添加BN层的这些网络作为分类网络，增强前后的图像作为输入来进行分类实验，并以测试集准确率评估性能。实验结果表明，三个经典分类网络均在添加了BN层后而使用相同输入时的测试集准确率提高了5个百分点，在使用细节增强后的图像作为输入时三个网络的测试集准确率提高了1个百分点，以上二者联合使用时三个网络均获得超过7个百分点的测试集准确率提升。

参考文献 | 相关文章 | 多维度评价

Select

4. 基于多层次分辨率递进生成对抗网络的文本生成图像方法

许一宁, 何小海, 张津, 卿粼波

计算机应用 2020, 40 (12): 3612-3617. DOI: 10.11772/j.issn.1001-9081.2020040575

摘要（344）

PDF （1238KB）（348）

针对文本生成图像任务存在生成图像有目标结构不合理、图像纹理不清晰等问题，在注意力生成对抗网络（AttnGAN）的基础上提出了多层次分辨率递进生成对抗网络（MPRGAN）模型。首先，在低分辨率层采用语义分离-融合生成模块，将文本特征在自注意力机制引导下分离为3个特征向量，并用这些特征向量分别生成特征图谱；然后，将特征图谱融合为低分辨率图谱，并采用mask图像作为语义约束以提高低分辨率生成器的稳定性；最后，在高分辨率层采用分辨率递进残差结构，同时结合词注意力机制和像素混洗来进一步改善生成图像的质量。实验结果表明，在数据集CUB-200-2011和Oxford-102上，所提模型的IS分别达到了4.70和3.53，与AttnGAN相比分别提高了7.80%和3.82%。MPRGAN模型能够在一定程度上解决结构生成不稳定的问题，同时其生成的图像也更接近真实图像。

参考文献 | 相关文章 | 多维度评价

Select

5. 基于非均匀量化的小波域分布式深度图视频编码

陈真真, 卿粼波, 何小海, 汪芸

计算机应用 2016, 36 (4): 1080-1084. DOI: 10.11772/j.issn.1001-9081.2016.04.1080

摘要（485）

PDF （734KB）（388）

针对分布式多视点加深度格式(DMVD)的视频编码中深度图视频解码质量问题,提出一种结合子带层及子带系数的小波域分布式深度视频非均匀量化方案,通过给边缘分配更多比特来提升深度图的边缘质量。结合深度图经小波变换后系数分布特性,对第N层的低频小波系数采用均匀量化方案,对其他层高频小波系数采用非均匀量化方案。针对高频系数的非均匀量化,对处于"0"左右的高频系数采用较大的量化步长,随着高频系数幅度值的增大,量化步长逐渐减小,量化逐渐精细,从而提升深度图中的边缘细节质量。实验结果表明,对于边缘较多且变化较明显的"Dancer"和"PoznanHall2"深度序列,该算法能够有效地提高二者的边缘信息质量从而提高其率失真(R-D)性能,最高可达1.2 dB;而对于边缘区域较小且较为模糊的"Newspaper"和"Balloons"深度序列,系统的R-D性能也能被提升0.3 dB左右。

参考文献 | 相关文章 | 多维度评价

Select

6. 基于H.264的多参考帧运动估计快速算法

严浩何小海卿粼波吕瑞曾强宇

计算机应用 2010, 30 (06): 1626-1628.

摘要（1480）

PDF （488KB）（1014）

H.264/AVC中引入多参考帧运动补偿来提高视频编码性能,由此产生的多参考帧运动估计(MRF-ME)却带来了巨大的运算代价。为提高编码速度,降低计算复杂度,提出一种基于空间域相关性的运动估计算法——缩小的菱形算法(DDS)。先运用前向主矢量选择法不断修正预测运动矢量,再根据最佳参考帧位置的统计特性对不同参考帧使用不用模板进行搜索。实验结果表明,与H.264参考模型JM10.2相比,该算法保持了较好的图像质量且码率变化很小,运动搜索点数平均减少接近80%,并能有效地降低编码器复杂度。